En el marco socioeconómico de la Unión Europea, la cohesión territorial y la reducción de las desigualdades siguen siendo desafíos primordiales. Si bien los indicadores macroeconómicos nacionales suelen acaparar la atención mediática, la renta disponible de los hogares se erige como el indicador más fiel para medir el bienestar real de la ciudadanía, su capacidad de consumo y su nivel de ahorro. En la coyuntura actual, marcada por la recuperación post-pandemia y las tensiones inflacionarias, analizar la evolución de la riqueza familiar no es solo un ejercicio estadístico, sino una herramienta fundamental para evaluar la salud económica real de las familias y la efectividad de las políticas de convergencia europeas.
El problema central que aborda este proyecto radica en que los promedios nacionales a menudo enmascaran profundas disparidades internas. Un análisis limitado al nivel de país (NUTS 0) es insuficiente para comprender la realidad de territorios con dinámicas propias. Por tanto, este estudio desciende al nivel NUTS 2 para visibilizar estas brechas, delimitando el análisis a la evolución comparada de las regiones europeas durante las últimas dos décadas (2000-2022). Específicamente, se pone el foco en la posición relativa de las Comunidades Autónomas españolas, y de manera singular en Canarias como región ultraperiférica, para determinar si existe una convergencia real en términos de renta neta y poder adquisitivo (PPS) frente a los estándares europeos o si, por el contrario, la brecha regional tiende a perpetuarse.
Una de las principales motivaciones que me ha llevado a elegir un dataset de este tema es una aspiración que tengo de vivir o estudiar fuera de España, sobretodo por temas laborales entre otros y por calidad de vida. Yo considero que los aspectos económicos son un factor muy importante a tener en cuenta para esto, el poder comparar a España con otros países o incluso poder comparar España internamente para ver como es económicamente en distintos factores es algo que me ha impulsado a elegir este tema de trabajo. Además, las cuestiones económicas siempre me han llamado más la atención que cualquier otra.
| ODS | No procede | Bajo | Medio | Alto |
|---|---|---|---|---|
| 1 Fin de la Pobreza | X | |||
| 2 Hambre cero | X | |||
| 3 Salud y Bienestar | X | |||
| 4 Educación de calidad | X | |||
| 5 Igualdad de género | X | |||
| 6 Agua limpia y saneamiento | X | |||
| 7 Energía Asequible y no contaminante | X | |||
| 8 Trabajo decente y crecimiento económico | X | |||
| 9 Industria, Innovación e Infraestructuras | X | |||
| 10 Reducción de las desigualdades | X | |||
| 11 Ciudades y comunidades sostenibles | X | |||
| 12 Producción y consumo sostenibles | X | |||
| 13 Acción por el clima | X | |||
| 14 Vida submarina | X | |||
| 15 Vida de ecosistemas terrestres | X | |||
| 16 Paz, justicia e instituciones sólidas | X | |||
| 17 Alianzas para lograr objetivos | X |
Utilizaremos la metodología de desarrollo CRISP-DM (Cross Industry Standard Process for Data Mining) que es un marco ampliamente utilizado para proyectos de Ciencias de Datos. En la siguiente figura se presenta un diagrama con las diferentes fases de esta metodología que a continuación describimos con más detalle:
Diagrama metodología de desarrollo CRISP-DM
Es importante observar que esta metodología es iterativa, es decir que los resultados obtenidos en algunas de las fases puede afectar al desarrollo de fases anteriores.
A continuación se describirá en detalle como se han abordado cada una de las fases del desarrollo del proyecto siguiendo esta metodología.
Para la búsqueda de datos, lo que se ha hecho es buscar directamente en la lista de datasets de Eurostat, en primer lugar había encontrado un dataset interesante pero este prácticamente hacía imposible la combinación de atributos además de tener inexistentes o pocos datos para España y Canarias, finalmente encontré el dataset con el que he trabajado y en este caso apenas he tenido incidencias o dificultades.
Para la búsqueda del segundo dataset han existido mas problemas ya que principalmente teníamos un dataset de población y sumábamos por grupos para concentrar a la poblacion entre 15 y 65 años y de esta manera normalizar los valores de los atributos, sin embargo, este dataset tenía problemas ya que los valores eran observaciones tomadas el 1 de enero de cada año, esto hacía que los resultados fueran valores lejanos de la realidad. El problema es que normalmente para calcular datos económicos per cápita no se suele separar por grupos y lo que se hace es tomar datos de poblaciones que representen la media de la población en un año, dicho esto, tuve que buscar otro dataset que contaba con estas característica y que proporcionaba valores mucho más exactos.
El conjunto de datos contiene información anual sobre diversas partidas de ingreso de los hogares, desglosada por regiones NUTS. Las variables categóricas (dimensiones) que estructuran el dataset se describen a continuación:
Frecuencia de las observaciones (freq)
-> Define la periodicidad con la que se registran las
observaciones.
Unidad de Medida (unit) ->
Especifica la unidad utilizada para expresar el valor numérico
(values) de la observación. Es crucial para garantizar la
comparabilidad de los datos.
EUR_HAB -> Euros por habitante. Muestra la cifra de ingresos dividida por el número de personas en la región. Se utiliza para medir la renta promedio individual en euros. No está ajustada por lo que valen las cosas en esa región.
MIO_EUR -> Millones de Euros. Es el valor total de los ingresos de la región. Se utiliza para medir el tamaño o volumen total de la economía regional en la moneda común.
MIO_NAC -> Millones de Moneda Nacional. Es el valor total en la moneda del país antes de que adoptara el Euro (por ejemplo, en pesetas o francos). Solo es útil para analizar datos de años anteriores a la zona Euro.
MIO_PPS_EU27_2020 -> Millones de Estándares de Poder Adquisitivo (PPS). El PPS es una “moneda de comparación” que elimina el efecto de los precios. Si una región es muy cara, el PPS ajusta el ingreso a la baja; si es barata, lo ajusta al alza. Se usa para comparar el volumen económico real entre regiones.
PPS_EU27_2020_HAB -> PPS por habitante. Es la métrica más valiosa para las comparaciones. Muestra el ingreso promedio por persona, pero ajustado por el costo de vida. Esta unidad refleja de forma más precisa el nivel de vida real y la capacidad de compra de los habitantes en distintas regiones.
Dirección de Flujo (direct) ->
Indica la naturaleza de la transacción económica, especificando si es un
saldo o una operación de pago/recepción.
BAL (Balance): Representa un saldo neto (la diferencia entre ingresos y gastos o entre activos y pasivos). Es el resultado final de una cuenta económica.
PAID (Pagado): Hace referencia al valor de las transferencias o pagos realizados por el sector de los hogares.
RECV (Recibido): Hace referencia al valor de los ingresos o transferencias recibidas por el sector de los hogares.
Indicador de Cuentas Nacionales
(na_item) -> Esta es la dimensión clave que define la
variable económica exacta que se está midiendo, siguiendo la
nomenclatura del Sistema Europeo de Cuentas (SEC 2010).
B5N -> Ingreso Primario Neto: El saldo de las rentas que reciben los hogares por su participación directa en la producción y la propiedad (salarios, rentas de la propiedad e ingresos de autoempleo), antes de transferencias e impuestos.
B6N -> Ingreso Disponible Neto: El saldo final que queda en manos de los hogares para consumo o ahorro, una vez que se han restado los impuestos y añadido las prestaciones sociales.
B7N -> Ahorro Neto: La porción del Ingreso Disponible que no se consume. Es la diferencia entre el Ingreso Disponible y el Gasto en Consumo Final.
D1 -> Remuneración de los Asalariados: El total de salarios y cotizaciones sociales pagadas por los empleadores. Es un componente clave del Ingreso Primario.
D4 -> Rentas de la Propiedad: Ingresos recibidos de la propiedad de activos (intereses, dividendos, rentas de la tierra, etc.).
D61 -> Cotizaciones Sociales Netas: Contribuciones pagadas a la seguridad social, ajustadas para reflejar las cuentas netas.
D62 -> Prestaciones Sociales Distintas de las Transferencias Sociales en Especie: Los beneficios que los hogares reciben del Estado (pensiones, prestaciones por desempleo, etc.) en forma de dinero.
D63 -> Transferencias Sociales en Especie: Bienes y servicios proporcionados gratuitamente o a precios bajos por el Estado (como servicios de salud o educación).
D7 -> Otras Transferencias Corrientes: Partidas residuales de transferencias monetarias no clasificadas en las anteriores categorías.
B2A3N -> Excedente Bruto de Explotación y Renta Mixta: El beneficio derivado de las actividades de producción, en el contexto de los hogares suele referirse al ingreso de los trabajadores autónomos (renta mixta).
P3 -> Gasto en Consumo Final: El valor de los bienes y servicios utilizados por los hogares para la satisfacción directa de sus necesidades.
P51C -> Formación Bruta de Capital Fijo: La inversión en activos fijos (viviendas, maquinaria, etc.) por parte del sector de los hogares.
Región Geográfica (geo) -> Define la
región geográfica a la que se refiere la observación, utilizando la
Nomenclatura Común de Unidades Territoriales de Estadística (NUTS).
Valores: Los valores son códigos alfanuméricos estandarizados:
Códigos de dos letras (e.g., AT, BE, ES): Representan el total del país (ejemplo, Austria, Bélgica, España).
Códigos NUTS 1, NUTS 2 y NUTS 3 (e.g., AT1, AT11, AT111): Representan el desglose regional de los datos. NUTS 2 es el nivel predominante en este dataset (por ejemplo, Comunidades Autónomas, grandes regiones).
Las observaciones (variables no categóricas) con valor numérico que aparecen en este dataset son:
Fecha de la observación (TIME_PERIOD)
-> Esta variable especifica el punto temporal al que
se refiere el valor registrado. En un dataset con frecuencia
Anual (freq = "A"), esta columna contendrá
el año de la observación, en este caso, tomada el primer día del
año.
Valor de la observación (values) ->
Esta es la variable numérica principal que contiene la
medida estadística de interés.
na_item): Por ejemplo, si
es Ingreso Disponible Neto (B6N).unit): Por ejemplo, si
está en Euros por habitante (EUR_HAB).geo): La región NUTS 2.TIME_PERIOD): El año de la
medición.## COLUMNA: freq
## freq N.Observ full_name
## [1,] A 285294 Annual
## COLUMNA: unit
## unit N.Observ full_name
## [1,] MIO_EUR 115674 Million euro
## [2,] MIO_NAC 115674 Million units of national currency
## [3,] MIO_PPS_EU27_2020 18176 Million purchasing power standards (PPS,..
## [4,] EUR_HAB 17885 Euro per inhabitant
## [5,] PPS_EU27_2020_HAB 17885 Purchasing power standard (PPS, EU27 fro..
## COLUMNA: direct
## direct N.Observ full_name
## [1,] BAL 110856 Balance
## [2,] PAID 89588 Paid
## [3,] RECV 84850 Received
## COLUMNA: na_item
## na_item N.Observ full_name
## [1,] B5N 44072 Balance of primary incomes/national inco..
## [2,] B6N 44072 Disposable income, net
## [3,] D4 36100 Property income
## [4,] D7 36100 Other current transfers
## [5,] D61 28370 Net social contributions
## [6,] D62 28106 Social benefits other than social transf..
## [7,] D1 18242 Compensation of employees
## [8,] B2A3N 18162 Operating surplus and mixed income, net
## [9,] D5 18050 Current taxes on income, wealth, etc.
## [10,] P51C 4986 Consumption of fixed capital
## [11,] B7N 4550 Adjusted disposable income, net
## [12,] P3 2346 Final consumption expenditure
## [13,] D63 2138 Social transfers in kind
##
## CONTABILIZACIÓN Nº REGIONES NUTS A PARTIR DE LA COLUMNA geo
## NUTS Number of Regions
## [1,] 0 29
## [2,] 1 94
## [3,] 2 251
## [4,] EU27_2020 1
## [5,] OTHERS 15
##
## COLUMNA: TIME_PERIOD
## TIME_PERIOD N.observ
## [1,] 1995-01-01 2230
## [2,] 1996-01-01 2230
## [3,] 1997-01-01 2230
## [4,] 1998-01-01 2230
## [5,] 1999-01-01 2230
## [6,] 2000-01-01 11590
## [7,] 2001-01-01 11590
## [8,] 2002-01-01 11590
## [9,] 2003-01-01 11590
## [10,] 2004-01-01 11590
## [11,] 2005-01-01 11590
## [12,] 2006-01-01 11596
## [13,] 2007-01-01 11596
## [14,] 2008-01-01 11632
## [15,] 2009-01-01 11632
## [16,] 2010-01-01 11688
## [17,] 2011-01-01 11928
## [18,] 2012-01-01 11928
## [19,] 2013-01-01 11928
## [20,] 2014-01-01 11932
## [21,] 2015-01-01 11884
## [22,] 2016-01-01 11942
## [23,] 2017-01-01 11942
## [24,] 2018-01-01 11942
## [25,] 2019-01-01 11942
## [26,] 2020-01-01 12168
## [27,] 2021-01-01 12154
## [28,] 2022-01-01 11724
## [29,] 2023-01-01 3046
El dataset (nama_10r_2hhinc) se presenta en una
estructura ordenada (tidy). Esta organización
se define porque cada fila representa una única
observación. Es decir, la combinación de las variables
categóricas (geo, na_item, unit,
etc.) y la variable temporal (TIME_PERIOD) define de forma
unívoca la medición. El resultado de esta medición se almacena en una
sola columna numérica (values). Este formato, también
conocido como “formato largo,” es el más eficiente y recomendado para la
manipulación y el análisis directo de datos en entornos de software
estadístico como R.
## tibble [285,294 × 7] (S3: tbl_df/tbl/data.frame)
## $ freq : chr [1:285294] "A" "A" "A" "A" ...
## $ unit : chr [1:285294] "MIO_EUR" "MIO_EUR" "MIO_EUR" "MIO_EUR" ...
## $ direct : chr [1:285294] "BAL" "BAL" "BAL" "PAID" ...
## $ na_item : chr [1:285294] "B2A3N" "B5N" "B6N" "D4" ...
## $ geo : chr [1:285294] "BE" "BE" "BE" "BE" ...
## $ TIME_PERIOD: Date[1:285294], format: "1995-01-01" "1995-01-01" ...
## $ values : num [1:285294] 24926 168359 135254 3783 29816 ...
El tamaño máximo de las series temporales es 29 y se cumplen los requisitos de longitud de series temporales. Tenemos datos desde el año 1995 hasta 2023, pero en especial, la mayor cantidad de observaciones se da entre los años 2000 y 2022.
## # A tibble: 1 × 7
## min p10 p25 p50 p75 p90 max
## <int> <dbl> <dbl> <dbl> <dbl> <dbl> <int>
## 1 2 23 23 23 24 29 29
En cuanto a la distribución del número de observaciones, tenemos que
p50 = 736 y que el máximo es 1188 lo cual está bien
teniendo en cuenta de que en su mayoría, este dataset tiene datos sobre
regiones NUTS2. Además, España y Canarias son regiones que son
interesantes y ambas cuenta con un buen número de observaciones, 934
para ser exactos.
Percentiles de la distribución del nº de observaciones por regiones
## # A tibble: 1 × 7
## min p10 p25 p50 p75 p90 max
## <int> <dbl> <dbl> <dbl> <dbl> <dbl> <int>
## 1 34 644 644 736 796 934 1188
Nº de observaciones en España/Canarias
## # A tibble: 3 × 3
## geo full_name N.Observ
## <chr> <chr> <int>
## 1 ES Spain 934
## 2 ES7 Canarias 934
## 3 ES70 Canarias 934
Los datos nos proporcionan un total de 42 posibles combinaciones de las variables categóricas, cada combinación con número de observaciones por lo general cercano a 9000, aunque también vemos algunas pocas que tienen entre 1000 y 5000 observaciones.
## # A tibble: 42 × 7
## # Groups: freq, unit, direct [9]
## freq unit direct na_item N.observ init.date end.date
## <chr> <chr> <chr> <chr> <int> <date> <date>
## 1 A MIO_EUR RECV D1 9121 1995-01-01 2023-01-01
## 2 A MIO_NAC RECV D1 9121 1995-01-01 2023-01-01
## 3 A MIO_EUR BAL B5N 9088 1995-01-01 2023-01-01
## 4 A MIO_EUR BAL B6N 9088 1995-01-01 2023-01-01
## 5 A MIO_NAC BAL B5N 9088 1995-01-01 2023-01-01
## 6 A MIO_NAC BAL B6N 9088 1995-01-01 2023-01-01
## 7 A MIO_PPS_EU27_2020 BAL B5N 9088 1995-01-01 2023-01-01
## 8 A MIO_PPS_EU27_2020 BAL B6N 9088 1995-01-01 2023-01-01
## 9 A MIO_EUR BAL B2A3N 9081 1995-01-01 2023-01-01
## 10 A MIO_NAC BAL B2A3N 9081 1995-01-01 2023-01-01
## 11 A MIO_EUR PAID D61 9065 1995-01-01 2023-01-01
## 12 A MIO_EUR RECV D62 9065 1995-01-01 2023-01-01
## 13 A MIO_NAC PAID D61 9065 1995-01-01 2023-01-01
## 14 A MIO_NAC RECV D62 9065 1995-01-01 2023-01-01
## 15 A MIO_EUR PAID D4 9025 1995-01-01 2023-01-01
## 16 A MIO_EUR PAID D5 9025 1995-01-01 2023-01-01
## 17 A MIO_EUR PAID D7 9025 1995-01-01 2023-01-01
## 18 A MIO_EUR RECV D4 9025 1995-01-01 2023-01-01
## 19 A MIO_EUR RECV D7 9025 1995-01-01 2023-01-01
## 20 A MIO_NAC PAID D4 9025 1995-01-01 2023-01-01
## 21 A MIO_NAC PAID D5 9025 1995-01-01 2023-01-01
## 22 A MIO_NAC PAID D7 9025 1995-01-01 2023-01-01
## 23 A MIO_NAC RECV D4 9025 1995-01-01 2023-01-01
## 24 A MIO_NAC RECV D7 9025 1995-01-01 2023-01-01
## 25 A EUR_HAB BAL B5N 8404 2000-01-01 2023-01-01
## 26 A EUR_HAB BAL B6N 8404 2000-01-01 2023-01-01
## 27 A PPS_EU27_2020_HAB BAL B5N 8404 2000-01-01 2023-01-01
## 28 A PPS_EU27_2020_HAB BAL B6N 8404 2000-01-01 2023-01-01
## 29 A MIO_EUR RECV D61 5120 1995-01-01 2023-01-01
## 30 A MIO_NAC RECV D61 5120 1995-01-01 2023-01-01
## 31 A MIO_EUR PAID D62 4988 1995-01-01 2023-01-01
## 32 A MIO_NAC PAID D62 4988 1995-01-01 2023-01-01
## 33 A MIO_EUR PAID P51C 2493 1995-01-01 2023-01-01
## 34 A MIO_NAC PAID P51C 2493 1995-01-01 2023-01-01
## 35 A MIO_EUR BAL B7N 1198 1995-01-01 2023-01-01
## 36 A MIO_NAC BAL B7N 1198 1995-01-01 2023-01-01
## 37 A MIO_EUR PAID P3 1173 1995-01-01 2023-01-01
## 38 A MIO_NAC PAID P3 1173 1995-01-01 2023-01-01
## 39 A EUR_HAB BAL B7N 1077 2000-01-01 2023-01-01
## 40 A PPS_EU27_2020_HAB BAL B7N 1077 2000-01-01 2023-01-01
## 41 A MIO_EUR RECV D63 1069 1995-01-01 2023-01-01
## 42 A MIO_NAC RECV D63 1069 1995-01-01 2023-01-01
En general, no se han encontrado inconsistencias y no hay datos faltantes en los casos de España y Canarias, que son las regiones más interesantes.
Visualización España/Canarias (máximo 60 columnas y 1000 filas por región)
A continuación veremos información sobre nuestro dataset
secundario que incluye datos de población anual por zonas.
## COLUMNA: freq
## freq N.Observ full_name
## [1,] A 40358 Annual
## COLUMNA: unit
## unit N.Observ full_name
## [1,] THS 40358 Thousand
##
## CONTABILIZACIÓN Nº REGIONES NUTS A PARTIR DE LA COLUMNA geo
## NUTS Number of Regions
## [1,] 0 34
## [2,] 1 111
## [3,] 2 293
## [4,] 3 1327
## [5,] EU27_2020 1
## [6,] OTHERS 24
##
## COLUMNA: TIME_PERIOD
## TIME_PERIOD N.observ
## [1,] 2000-01-01 1554
## [2,] 2001-01-01 1571
## [3,] 2002-01-01 1571
## [4,] 2003-01-01 1571
## [5,] 2004-01-01 1691
## [6,] 2005-01-01 1691
## [7,] 2006-01-01 1695
## [8,] 2007-01-01 1695
## [9,] 2008-01-01 1716
## [10,] 2009-01-01 1716
## [11,] 2010-01-01 1733
## [12,] 2011-01-01 1733
## [13,] 2012-01-01 1733
## [14,] 2013-01-01 1733
## [15,] 2014-01-01 1770
## [16,] 2015-01-01 1770
## [17,] 2016-01-01 1770
## [18,] 2017-01-01 1770
## [19,] 2018-01-01 1770
## [20,] 2019-01-01 1770
## [21,] 2020-01-01 1735
## [22,] 2021-01-01 1755
## [23,] 2022-01-01 1717
## [24,] 2023-01-01 1128
El dataset (nama_10r_3popgdp) se presenta en una
estructura ordenada (tidy). Esta organización
se define porque cada fila representa una única
observación. Es decir, la combinación de las variables
categóricas y la variable temporal (TIME_PERIOD) define de
forma unívoca la medición. El resultado de esta medición se almacena en
una sola columna numérica (values). Este formato, también
conocido como “formato largo,” es el más eficiente y recomendado para la
manipulación y el análisis directo de datos en entornos de software
estadístico como R.
## tibble [40,358 × 5] (S3: tbl_df/tbl/data.frame)
## $ freq : chr [1:40358] "A" "A" "A" "A" ...
## $ unit : chr [1:40358] "THS" "THS" "THS" "THS" ...
## $ geo : chr [1:40358] "AT" "AT1" "AT11" "AT111" ...
## $ TIME_PERIOD: Date[1:40358], format: "2000-01-01" "2000-01-01" ...
## $ values : num [1:40358] 8011.6 3364.6 276.1 38.1 137.7 ...
Empezamos cargando nuestro dataset, pasamos la variable
TIME_PERIOD a tipo ‘date’ y ordenamos por dicha variable y
por geo.
Ahora, vamos a convertir TIME_PERIOD para que
únicamente nos aparezca el año, quitando el día y el
mes y además vamos a filtrar para que solo aparezcan los años
desde el 2000 hasta el 2022, ya que son los años en los
que hay más observaciones. Luego, como solo tenemos códigos de cada
región y no sus nombres, vamos a añadirle una tabla que nos proporciona
todos los nombres y su información de NUTS a partir de
su código geo.
A continuación vamos a cargar un dataset de población que toma como
población la media de cada año, esto es lo más correcto
para normalizar datos económicos para los que no se tienen datos per
cápita como sucede en nuestro caso para muchos indicadores. En cada caso
que lo necesitemos, simplemente uniremos esta tabla a otra filtrada con
los paises o provincias que queramos por la columna geo y
TIME_PERIOD y normalizaremos los valores necesarios. Le
cambiamos el nombre a la columna values por
poblacion para evitar confusiones. Eliminamos las columnas
de freq y unit ya que solo tienen un valor y
no nos sirven de nada, por último cambiamos el formato de fecha para que
aparezca únicamente el año y lo pasamos a dato numérico.
Para este apartado y el siguiente, procederemos a hacer un breve análisis que va desde dentro de España hacia afuera, terminando con una visión general sobre algunos datos. Cuando analicemos las comunidades de España usaremos euros per cápita, ya que las unidades PPS se utilizan para hacer comparaciones de regiones diferentes donde el precio de la vida bastante diferente.
Para empezar, comenzamos viendo la evolución de uno de los indicadores económicos más importante a nivel de bienestar de la población por comunidades de España, la renta neta en euros per cápita.
El análisis de la renta neta en España revela una tendencia alcista estructural, interrumpida únicamente por dos choques sistémicos claros: el estallido de la burbuja inmobiliaria (2008-2013) y la crisis sanitaria del COVID-19 (2020). Si bien todas las regiones comparten este ciclo, se observa una divergencia persistente: las comunidades del norte y capitalinas (País Vasco, Navarra y Madrid) no solo lideran el ranking, sino que muestran una recuperación más robusta tras las crisis gracias a su tejido industrial y de servicios de alto valor.
Como dato curioso, pese a la recuperación general, muchas regiones tardaron casi una década en recuperar los niveles de poder adquisitivo previos a 2008, lo que evidencia la rigidez del mercado laboral español ante las recesiones.
Tras un primer vistazo sobre la renta neta en cada país, echemos un vistazo ahora a la capacidad de ahorro neto en euros per cápita por comunidades de España, y veamos si hay alguna similitud ya que la renta neta y la capacidad de ahorro deberían estar relacionadas. En este caso en lugar de ver una evolución, tenemos datos del último año que nos ofrece este dataset, 2022.
En general, los países que mejor renta neta per cápita presentaban son los que se encuentran más arriba en esta gráfica, como vemos, Canarias se sitúa bastante abajo en estos términos.
Para confirmar que efectivamente una mayor renta neta se traduce directamente en una mayor capacidad de ahorro neto, podemos echar un vistazo a este diagrama de dispersión animado que relaciona estos 2 conceptos por las diferentes comunidades autónomas a lo largo de los años en euros per cápita.
Como podemos ver existe una fuerte correlación entre la renta y el ahorro, en general las comunidades con mayor renta neta también presentan mayor capacidad de Ahorro. Se aprecian claramente retrocesos en los años de crisis y algo curioso es que a lo largo de los años las comunidades se alejan más unas de las otras, reflejando una mayor desigualdad en estos términos.
Las regiones como País Vasco, Navarra y Madrid se sitúan claramente por encima de la media nacional, mientras que Andalucía, Extremadura o Canarias presentan niveles más bajos tanto de renta como de ahorro.
Esto sugiere diferencias estructurales regionales en el poder adquisitivo y la capacidad de ahorro de los hogares.
Con esta última conclusión de las diferencias estructurales regionales, sería interesante dividir la renta total de España entre las distintas regiones de esta (Norte, Sur, Este, Noreste, Noroeste, Centro, Madrid y Canarias) y representarlo mediante un diagrama de disco para que ver que porcentaje se lleva cada zona, antes de ver el gráfico debemos saber que comunidades se agrupan en las distintas regiones:
Noroeste: Galicia, Principado de Asturias y Cantabria.
Noreste: País Vasco, Comunidad Foral de Navarra, La Rioja y Aragón.
Comunidad de Madrid: Comunidad de Madrid (Constituye una región única debido a su relevancia económica).
Centro: Castilla y León, Castilla-La Mancha y Extremadura.
Este: Cataluña, Comunidad Valenciana e Islas Baleares.
Sur: Andalucía, Región de Murcia, Ceuta y Melilla.
Canarias: Canarias (Constituye una región única por su carácter insular).
Tomaremos como unidad euros per cápita para que la población de cada zona no sea un factor influyente y sea una comparación efectiva.
Tras analizar la gráfica de disco, vemos que efectivamente las regiones del sur de España y Canarias presentan un menor poder adquisitivo y por consecuente, una menor capacidad de ahorro. La mayor parte de la renta cae sobre Madrid y las regiones del Noreste y Noroeste.
Ya que conocemos bien la renta neta que presenta cada comunidad en España, echemos un vistazo ahora a los impuestos sobre renta y patrimonio que se pagan en cada una, medidos en euros por habitante y representados mediante un mapa de calor. Tenemos datos desde el año 2016 hasta el 2022.
El mapa de calor de Impuestos sobre Renta y Patrimonio per cápita entre 2016 y 2022 es, en realidad, un mapa de la riqueza regional de España. Los tonos más oscuros confirman la relación fundamental de la fiscalidad: las comunidades que más pagan son las que más generan.
Riqueza como Causa: Regiones como la Comunidad de Madrid, el País Vasco y Navarra muestran la mayor presión fiscal directa (azul intenso). Esto se debe a que su Renta Disponible Neta es históricamente más alta, lo que automáticamente eleva el pago del IRPF debido a su naturaleza progresiva. El alto nivel de impuestos es el resultado de una base imponible (ingresos) superior.
Doble Medición del Impuesto: La variación en D.5 también subraya que no solo mide la renta generada en el año:
El IRPF refleja los ingresos corrientes.
Los impuestos patrimoniales (como el IBI) reflejan la riqueza acumulada (stock). Esto explica por qué regiones con alto valor inmobiliario, como las Islas Baleares, pueden tener una alta contribución fiscal per cápita.
Consecuencia Económica: La intensificación general del color azul después de 2020 indica un crecimiento de la renta nominal en el país. En última instancia, esta alta contribución fiscal en las regiones líderes confirma su rol como motores económicos: a pesar de pagar los impuestos más altos, su capacidad de Ingreso y su alto Ahorro Neto (B7N) residual las identifica como los principales centros de acumulación de capital de España.
Para finalizar con las comunidades de España, veamos mediante un diagrama de cajas, como se distribuyen los 3 principales indicadores económicos, Ingreso primario neto, Renta neta y Ahorro neto por las distintas comunidades españolas en euros por habitante.
Como comentábamos, este gráfico muestra la distribución de los distintos tipos de ingreso por habitante en las regiones españolas. Se observa que el ingreso primario (B5N) es el más alto y disperso, mientras que la renta neta (B6N) se reduce tras impuestos y transferencias, evidenciando el efecto redistributivo. El ahorro (B7N) presenta mayor variabilidad, reflejando diferencias regionales en la capacidad de ahorro. Los outliers principalmente se corresponden con regiones con niveles excepcionalmente altos en estos indicadores, sobretodo Madrid y País Vasco como ya hemos visto, donde el PIB y las rentas tienden a ser más elevadas.
Centrémonos ahora en visualizar y comparar a España como país, en este caso tendremos que usar unidades PPS mayoritariamente siempre que el dataset nos ofrezca datos en esta unidad, ya que estamos comparando distintos países.
En primer lugar vamos a utilizar una función de pareto para quedarnos con los países que poseen el 80% de la renta neta de Europa entre los cuales se encuentra España y vamos a ver un gráfico de barras animado que nos muestra la evolución de esos países cada año.
Vemos que, en general, España es un país que se mueve en valores de renta cercanos a los de la media de la Unión Europea. El declive posterior a 2008 es un reflejo de la fuerte dependencia de España de sectores cíclicos (como la construcción y el turismo) y del alto desempleo estructural. Mientras que las economías industriales del norte rebotaron con relativa rapidez tras la crisis financiera, el crecimiento de la renta española se estancó. Vemos que los dos países con mejores niveles de renta neta per cápita son Luxemburgo y Alemania, vamos a comentar estos dos casos por separado.
Luxemburgo es un caso atípico que distorsiona las métricas macroeconómicas de renta per cápita, lo cual es importante para interpretar cualquier resultado:
Centro Fiscal: Gran parte de la renta contable se genera por los beneficios de empresas multinacionales y los flujos financieros que se registran en el país por motivos fiscales.
Efecto de Denominador: Al ser un país pequeño, cuando estos flujos de capital se dividen por una población relativamente reducida, la cifra per cápita se dispara artificialmente, sin que este aumento refleje necesariamente el poder adquisitivo directo del trabajador promedio residente.
La alta renta alemana se sustenta en su potente base industrial y manufacturera.
Valor Añadido Bruto (VAB): El enfoque en la ingeniería, la automoción de alta gama y la química asegura que la producción nacional genere un VAB elevado.
Estabilidad: Esta estructura de exportación de bienes de capital proporciona una fuente de ingresos nacionales estable y constante, lo que se traslada a salarios altos y, por ende, a una renta disponible por habitante consistentemente superior a la media.
Continuémos viendo la evolución económica de los países, en este caso vamos a echar un vistazo a la evolución del ingreso primario neto, es decir, los ingresos brutos per cápita de cada país medidos en unidades PPS. Dado que Europa tiene muchos países, en este caso mostraremos los países más interesantes a comparar con España.
Ilustraremos esto con un gráfico de líneas.
En general con este gráfico llegamos a las mismas conclusiones que antes pero, sin embargo, este nos permite más enforcanos que valores toma España con respecto a la media de la Unión Europea, vemos con claridad que hasta antes de la crisis del 2008 España se situaba por encima de esta y que después de dicha crisis no consigue recuperase de la misma manera que la media a pesar de que la tendencia sigue siendo ascendente.
Y bueno ya que venimos viendo la evolución del ingreso primario neto (ingreso bruto), puede ser interesante ver en cada país la intervención del Estado sobre este ingreso primario, es decir, cuánto dinero pierde o gana un hogar después de que el Estado aplica impuestos y devuelve beneficios (prestaciones sociales recibidas), para este caso también incluiremos a Canarias junto con los países.
Para cuantificar y visualizar el impacto de la intervención del Estado en el ingreso de los hogares, se utiliza la Renta Disponible Neta, la cual, por definición en las cuentas nacionales, es el resultado final después de aplicar impuestos y transferencias sociales.
Es crucial entender que la Renta Disponible Neta ya incorpora las prestaciones sociales recibidas y otros beneficios, y por tanto, no es necesario incluirlas en la fórmula de cálculo.
Si el resultado es POSITIVO (Ingreso Primario > Renta Neta): El país es un Pagador Neto (El Estado quita más de lo que devuelve).
Si el resultado es NEGATIVO (Ingreso Primario < Renta Neta): El país es un Receptor Neto (El Estado devuelve más de lo que quita).
El gráfico de Efecto Neto de la Redistribución Fiscal muestra una clara y pronunciada polarización económica en Europa, revelando la diferencia entre el Ingreso Primario y la Renta Disponible.
El resultado evidencia que las economías se dividen en dos grandes grupos:
Pagadores Netos (Contribuyentes): Los países del Norte y Centro de Europa (Dinamarca, Países Bajos, Luxemburgo y Alemania) son los mayores contribuyentes netos, con un hogar promedio que cede entre 8.000€ y 10.000€ al Estado después de impuestos y transferencias. Esta fuerte presión fiscal refleja la financiación de robustos Estados de Bienestar y la alta recaudación.
Receptores Netos (Asistencia): En contraste, las economías del Sur y del Este de Europa (incluyendo Grecia, Polonia, Portugal, y Eslovaquia) se sitúan cerca del valor cero o son receptores netos, lo que indica que las prestaciones y transferencias sociales que reciben sus hogares son casi iguales o superiores a los impuestos que pagan.
España se sitúa como un contribuyente neto moderado, lejos de las cifras de cabeza, pero todavía con una contribución positiva, mientras que las regiones periféricas y más débiles (como Canarias en la lista) son, en esencia, fiscalmente neutrales.
En la gráfica anterior, vimos el saldo final de la intervención del Estado, identificando qué países eran contribuyentes netos (Pagadores Netos) y cuáles dependían más de las ayudas sociales (Receptores Netos).
Ahora, para entender mejor la magnitud de la diferencia que genera ese saldo, nos centraremos en la salida de recursos obligatoria que soporta cada hogar.
Para calcular esta carga fiscal directa sobre el ingreso, sumamos dos componentes clave que restan directamente de la renta de las familias: los Impuestos Corrientes sobre Renta y Patrimonio y las Cotizaciones Sociales Netas.
Este mapa de calor nos permitirá visualizar qué países y regiones tienen la mayor presión sobre el ingreso per cápita, la cual es necesaria para sostener sus respectivos sistemas de bienestar.
El mapa de calor de la Presión Fiscal Directa revela una nítida polarización entre la Europa del Norte y la del Este, lo cual confirma la solidez de los Estados de Bienestar en las regiones más ricas.
El análisis muestra que los países escandinavos y del Benelux (Dinamarca, Países Bajos y Suecia) imponen la mayor presión fiscal directa sobre el ingreso (por encima de los 20.000€ per cápita en varios casos), lo cual se debe a la financiación de sus amplios sistemas de seguridad social. En contraste, países con economías de menor escala (como Bulgaria, Croacia o Rumania) muestran la carga fiscal más baja. España se posiciona en un nivel intermedio-alto de contribución fiscal, lo cual es coherente con su rol como economía grande en la Eurozona.
El dato curioso es que esta visualización confirma que los países con la mayor presión fiscal (Dinamarca, Países Bajos) son precisamente los que resultaron ser Pagadores Netos en el análisis anterior, demostrando que la magnitud de la recaudación es la que dicta el saldo fiscal final.
Hemos analizado la presión fiscal directa sobre el ingreso de los hogares, que es el coste necesario para financiar los sistemas de bienestar y Cotizaciones. Ahora, es el momento de examinar el resultado final de esa riqueza generada y la capacidad de inversión.
Por último, cerramos el apartado con una visión geográfica y detallada del último año de datos (2022). Usaremos dos mapas coropléticos a nivel de regiones NUTS2 para ver cómo se distribuyen la Renta Disponible Neta y la Inversión en Activos Fijos, lo que nos permitirá extraer conclusiones específicas sobre los focos geográficos de mayor riqueza y dinamismo económico en Europa, utilizaremos unidades PPS para el caso de la Renta Neta y euros por habitante para el caso de la Inversión en Activos Fijos, ya que no tenemos datos con unidades PPS.
De este primer mapa podemos sacar las siguientes conclusiones:
El Eje Central de Riqueza: La renta disponible más alta (tonos rojos) se concentra claramente en el eje central de Europa (el ‘Arco de la Riqueza’): el sureste del Reino Unido (Londres), Benelux, el oeste y sur de Alemania (Baden-Württemberg, Baviera) y Escandinavia. Esto confirma que los países con la mayor presión fiscal directa son los que también tienen la mayor renta per cápita.
Disparidad Extrema: Existe un fuerte clivaje (división) Norte-Oeste/Sur-Este. La renta cae drásticamente en todo el Sur (Italia, Portugal, Grecia) y en los países de la ampliación oriental, que están en el rango más bajo (tonos amarillos).
Efecto Capital: Las capitales y los centros financieros (París, Dublín, Praga, Viena) se destacan como islas de alta renta (puntos rojos oscuros), reflejando la concentración de servicios de alto valor añadido.
Caso de España: España muestra una notable disparidad intra-nacional. Mientras que regiones como Madrid y el País Vasco se sitúan en el rango medio-alto de la UE, la mayor parte del territorio, especialmente Andalucía y Extremadura, se encuentra en el rango medio-bajo, alineado con el sur de Italia. Esto confirma la disparidad estructural regional interna de España.
Este segundo mapa revela que la inversión productiva se concentra en un eje muy específico de Europa Occidental y Central, que está desvinculado de la distribución de la renta disponible.
Foco de Capitalización: Los niveles de inversión más altos (tonos rojos intensos) se concentran en el tradicional “Cinturón Industrial” que abarca Francia, el norte de Italia (el principal foco), y el sur de Alemania/Austria.
Disparidad con la Renta: A diferencia del mapa de renta, donde Italia y Francia tenían niveles intermedios, aquí muestran la mayor intensidad de inversión. Esto sugiere que, si bien la renta disponible per cápita en estos países es menor que en Holanda o Dinamarca, el capital productivo se está inyectando con mayor fuerza en sus bases industriales.
Caso Español: España y Portugal se encuentran consistentemente en el rango bajo a medio (tonos amarillos y naranjas claros), lo que indica un atraso estructural en la inversión productiva en comparación con el núcleo industrial de la Eurozona.
Todas este análisis realizado en este apartado se encuentra desarrollado en mayor profundidad en el cuadro de mandos del proyecto, ahí se permite una mayor exploración en profundidad de las distintas variables y las distintas regiones.
En este apartado haremos un análisis utilizando algunos modelos matemáticos que nos permitirán realizar predicciones y medir relaciones entre las distintas variables.
Al igual que en el anterior apartado, este análisis irá desde dentro de España hacia afuera.
Empezaremos el análisis visualizando una predicción hasta 2030 de la evolución de la renta neta en euros per cápita por las diferentes Comunidades Españolas. Para una mayor precisión filtraremos a partir del año 2002 ya que fue cuando se introdujo el euro a España.
La proyección a 5 años revela un escenario de crecimiento desigual que expone las fracturas estructurales de la economía española:
El Norte se distancia: Las regiones con mayor renta base (País Vasco, Navarra y Madrid) presentan una pendiente de crecimiento robusta y constante, consolidando su liderazgo y alejándose del promedio nacional.
Convergencia Lenta: La mayoría de comunidades (Castilla y León, Aragón, Cataluña) mantienen una tendencia positiva pero moderada, alineada con la media nacional.
Rezago Estructural: Regiones como Extremadura, Canarias y Andalucía, aunque crecen, lo hacen a un ritmo insuficiente para cerrar la brecha con el norte, perpetuando la disparidad territorial observada en el análisis histórico.
La Anomalía de Ceuta y Melilla (Decrecimiento): El dato más alarmante lo arrojan las ciudades autónomas. A diferencia del resto del país, el modelo predice un estancamiento o ligero decrecimiento de la renta per cápita. Esto sugiere un desacople estructural preocupante: mientras la península se recupera, estas economías, condicionadas por su especificidad fronteriza y demográfica, no logran sumarse a la inercia de crecimiento general, ampliando drásticamente la brecha de desigualdad.
Tras identificar las marcadas disparidades geográficas tanto en la renta disponible como en la inversión productiva, es fundamental profundizar en la estructura subyacente de la economía regional europea. Para ello, aplicamos un Análisis de Componentes Principales (PCA) con el objetivo de reducir la dimensionalidad de los múltiples indicadores económicos y sociales. Este análisis nos permitirá determinar qué combinaciones de variables explican mejor la varianza entre las regiones, identificando si existe un patrón común que agrupe a las regiones ricas frente a las rezagadas, y qué peso tienen factores como los salarios, las prestaciones sociales o la inversión en dicha diferenciación.
Para realizar este análisis vamos generar un atributo combinado formado por el indicador económico y su dirección de flujo, es decir, si ha sido pagado, recibido, o es el resultado de un balance, hacemos esto ya que hay atributos con más de una dirección de flujo.
Primero veremos un gráfico de barras que nos mostrará que porcentaje de la dispersión de los datos explica cada componente y luego graficaremos la primera componente (eje x) y la segunda componente (eje y) para poder tener una visualización de dichas componentes.
El gráfico de sedimentación revela una estructura de datos altamente redundante, donde el primer componente principal (PC1) domina de manera abrumadora, capturando el 64.8% de la varianza total. Esto indica que la gran mayoría de las diferencias económicas entre las comunidades autónomas se pueden explicar por un único factor latente, muy probablemente relacionado con el tamaño y la riqueza general de la economía regional.
El segundo y tercer componente (PC2 y PC3) aportan un 11.2% y 10.7% respectivamente, sugiriendo matices adicionales (posiblemente relacionados con la estructura del mercado laboral o la especialización sectorial). Sin embargo, a partir del PC4, la varianza explicada cae drásticamente por debajo del 5%, lo que confirma que con solo los tres primeros componentes (que suman casi el 87% de la información) podemos obtener una representación muy fiel de la realidad socioeconómica regional, simplificando enormemente el análisis multivariante.
La proyección de las comunidades en el plano definido por el PC1 (Eje X: Tamaño y Riqueza) y el PC2 (Eje Y: Estructura de Bienestar) revela tres clústeres diferenciados:
El Polo de Poder Económico (Derecha): Madrid y País Vasco se sitúan en el extremo derecho positivo del PC1, seguidos por Cataluña e Islas Baleares. Esto confirma que son los motores económicos de España, con los valores más altos en casi todos los indicadores absolutos (Renta, Inversión, PIB).
El Eje Industrial y de Bienestar (Centro-Derecha): Navarra, La Rioja y Aragón ocupan una posición destacada, no solo en riqueza (PC1 alto), sino también diferenciados en el PC2, lo que sugiere una estructura de ingresos y bienestar particular, posiblemente ligada a su régimen foral y tejido industrial.
La Periferia Dependiente (Izquierda): Regiones como Extremadura, Castilla-La Mancha y las Ciudades Autónomas se agrupan en el lado negativo del PC1. Su posición indica una menor magnitud económica y una mayor dependencia relativa de las transferencias sociales frente a la generación de rentas primarias. Vemos que regiones como Canarias, Galacia o Cantabria se sitúan más en el Centro-Izquierda.
Es decir, el eje horizontal (PC1) actúa como un claro gradiente de desarrollo económico, ordenando a las comunidades desde las economías más subsidiadas hacia las más productivas y dinámicas.
Después de este breve análisis, vamos a pasar a analizar España como país conjunto.
Para empezar vamos a ver una predicción hasta 2030 de la evolución de la renta neta per cápita en España. En este caso también veremos una descomposición STL de la serie temporal a la que aplicamos el modelo ARIMA. Para una mayor precisión filtraremos a partir del año 2002 ya que fue cuando se introdujo el euro a España.
Consolidando el análisis a nivel nacional, el modelo ARIMA para España proyecta una recuperación robusta y sostenida hasta 2030. Tras la caída abrupta de 2020 y su posterior rebote en “V”, la tendencia central (línea azul) sugiere que la renta neta per cápita superará holgadamente los máximos históricos previos a la crisis financiera, acercándose a los 19.000€.
Sin embargo, la notable apertura del intervalo de confianza (zona sombreada) a medida que nos alejamos en el tiempo advierte de una incertidumbre macroeconómica creciente. Aunque la inercia es positiva, la volatilidad del contexto global podría condicionar la magnitud final de este crecimiento.
El análisis de descomposición de la serie temporal permite aislar los componentes estructurales de la renta neta española.
Tendencia (Trend): El componente de tendencia es el dominante, mostrando una trayectoria ascendente clara y suave a largo plazo. A pesar de las crisis, la inercia subyacente de la renta es de crecimiento continuo, lo que valida la robustez de la recuperación estructural.
Residuo (Remainder): El panel inferior revela las perturbaciones de origen externo. Se observan picos negativos muy marcados que coinciden con los grandes shocks económicos: la crisis financiera (2011-2013) y el impacto de la pandemia (2020). Estos residuos de gran magnitud confirman que las caídas de renta no fueron cambios de tendencia estructural, sino eventos puntuales de alta volatilidad que el modelo ARIMA debe absorber.
Una vez proyectada la senda de recuperación de la renta neta, es imprescindible analizar la contrapartida fiscal que acompaña a este crecimiento. Dado que el sistema tributario español es progresivo y que la renta disponible depende directamente de la capacidad recaudatoria del Estado para sostener los servicios públicos, el siguiente paso lógico es modelar la evolución esperada de la presión fiscal directa. A continuación, aplicamos el mismo modelo predictivo ARIMA para estimar cómo evolucionará la carga de Impuestos sobre la Renta y el Patrimonio que soportarán los hogares españoles en el próximo lustro.
Al igual que antes, filtraremos a partir del año 2002 ya que fue cuando se introdujo el euro a España y además veremos una descomposición STL de la serie temporal a la que se aplica el modelo ARIMA.
La proyección para los Impuestos sobre la Renta y Patrimonio dibuja un escenario de crecimiento sostenido y proporcional a la recuperación económica general.
Tendencia Estructural: El modelo anticipa una subida constante de la recaudación per cápita, proyectando superar los 3.500€ por habitante hacia 2030. Esta trayectoria alcista replica la pendiente observada en la renta neta, lo que sugiere un sistema fiscal estable que captura riqueza al mismo ritmo que esta se genera, sin indicios de un endurecimiento desproporcionado de la presión fiscal en el modelo actual.
Recuperación en “V”: Tras la caída de 2020, la recuperación de los ingresos tributarios es rápida y robusta, marcando nuevos máximos históricos ya en el corto plazo. Esto confirma la eficacia de los estabilizadores automáticos y la resiliencia de la base imponible española.
Incertidumbre a Largo Plazo: El abanico del intervalo de confianza (95%) se abre significativamente a partir de 2025. Esto refleja que, aunque la inercia es de crecimiento, la cifra final dependerá de factores externos (inflación, tipos de interés) y de posibles reformas normativas que el modelo puramente estadístico no puede anticipar.
La descomposición de la serie temporal de impuestos revela una estructura más compleja que la de la renta:
Tendencia Creciente y Acelerada: El componente de tendencia (Trend) muestra un crecimiento constante desde el año 2000, pero con una pendiente que se agudiza notablemente a partir de 2015. Esto confirma un aumento estructural de la presión fiscal per cápita, impulsada posiblemente por la recuperación económica y cambios normativos que han elevado la recaudación media.
Residuo Cíclico: A diferencia de la renta, el componente irregular (Remainder) presenta fluctuaciones más frecuentes y pronunciadas, especialmente visibles durante los periodos de crisis (2008-2012 y 2020). Esta mayor volatilidad en los residuos sugiere que la recaudación de impuestos es mucho más sensible a los ciclos económicos cortos y a las medidas políticas puntuales que la renta base de los hogares.
Ya que hemos realizado una predicción sobre renta neta e impuestos, puede ser interesante sumar a dichos impuestos sobre renta y patrimonio el total de salarios y cotizaciones sociales pagadas por los empleadores para tener una mejor estimación sobre la presión fiscal y ver la relación de esta con la renta neta por países, ambas variables medidas en euros per cápita.
Esto lo veremos mediante un diagrama de dispersión utilizando un modelo de regresión lineal y además aplicando una transformación yeojohnson sobre la variable del eje y (Renta Neta) y tomaremos el último año de las observaciones (2022).
El gráfico revela una correlación positiva muy fuerte y lineal: en Europa, disfrutar de una mayor renta disponible va intrínsecamente ligado a soportar una mayor carga fiscal. No hay países “ricos y baratos”; el bienestar se paga.
Puntos Clave y Curiosidades:
La Anomalía Danesa: Dinamarca es el caso más llamativo. Se sitúa muy por encima de la línea de tendencia, lo que indica un esfuerzo fiscal extraordinario. A niveles de renta similares a Alemania o Austria, un danés paga mucho más. Esto se debe a su modelo de bienestar único, financiado casi exclusivamente por impuestos directos a la renta en lugar de cotizaciones patronales invisibles.
El Equilibrio Español: España aparece justo sobre la línea de regresión, en la zona media. Esto desmiente la idea de anomalía: la presión fiscal que soportan los hogares españoles (\(~6.000\text{€}\)) es matemáticamente consistente con su nivel de renta (\(~17.000\text{€}\)). España recauda exactamente lo que se espera para una economía de su tamaño en el contexto europeo.
La Brecha Estructural: Existe una clara polarización. Mientras que el bloque de Europa del Este (Bulgaria, Rumanía) apenas alcanza los \(2.000\text{€}\) de contribución fiscal (limitando su capacidad de gasto público), las economías centrales (Bélgica, Alemania) triplican o cuadruplican esa cifra, permitiéndose servicios públicos mucho más robustos. La riqueza genera la base imponible necesaria para el Estado del Bienestar.
Por último, tras haber visto un diagrama de dispersión para ver la relación entre dos variables, hagamos una matriz de correlación utilizando un atributo combinado formado por la variable económica y su dirección de flujo para ver como se relacionan en general todas las variables entre países en el año 2022.
La matriz de correlación revela una estructura económica altamente interconectada, dominada por un bloque central de correlaciones positivas muy fuertes (>0.9) entre los principales agregados macroeconómicos. Esto indica que el tamaño y la riqueza de la economía son los factores determinantes: los países con mayor Ingreso Primario también tienen sistemáticamente mayor Renta Disponible, Ahorro Neto, Gasto Final e Inversión. Es decir, la escala económica dicta la magnitud de todos estos flujos.
El Ciclo del Bienestar (Renta-Impuestos-Prestaciones):
Existe una correlación casi perfecta (0.96) entre el Ingreso Primario y los Impuestos Pagados. Esto confirma la progresividad fiscal a nivel macroeconómico: las economías que generan más riqueza primaria son las que más recaudan para financiar el estado.
A su vez, estos Impuestos tienen una correlación altísima (0.96) con las Prestaciones Sociales Recibidas. Esto evidencia el funcionamiento del sistema de redistribución: la alta recaudación se traduce directamente en un alto retorno social a los hogares.
La Paradoja de las Prestaciones Pagadas:
Las Prestaciones Sociales Pagadas (es decir, las que salen de los hogares, no las que reciben) muestran una correlación negativa débil (-0.23 a -0.29) con todos los indicadores de riqueza. Esto sugiere que en las economías más ricas, los hogares no son los principales pagadores directos de estas prestaciones (probablemente financiadas por empresas o estado), o que este flujo es contra-cíclico respecto a la riqueza general.
Inversión y Ahorro:
La Inversión Fija y el Ahorro Neto tienen una correlación perfecta (1.0) con la Renta Disponible. Esto implica que la capacidad de inversión y ahorro de un país no depende de factores culturales o preferencias, sino que es una función directa y lineal de su nivel de renta disponible: más renta disponible se traduce matemáticamente en mayor inversión y ahorro agregado.
En conclusión, el mapa de calor valida un modelo económico europeo cohesivo donde la generación de riqueza primaria impulsa simultáneamente la capacidad fiscal, el gasto social y la inversión productiva y por tanto es normal que en su mayoría las variables estén correlacionadas de manera que cuando una aumenta las demás por lo general también lo hacen ya que así funciona la economía.
Todo este análisis realizado se encuentra desarrollado en mayor detalle en el cuadro de mandos del proyecto, permitiendo ahí una mayor exploración en profundidad por los diferentes años, indicadores y regiones.
TOTAL HORAS TRABAJADAS EN EL PROYECTO : 61.3
DESGLOSE DETALLADO DE LAS SESIONES DE TRABAJO